初探InnoDB MVCC源码实现
转载自博客园本文链接地址: 初探InnoDB MVCC源码实现
1. 背景
本文基于MySQL InnoDB源码对InnoDB中非锁定一致性读是如何实现的作一些简单的探究。
2. 基本概念
2.1 隐藏字段
在经典之作《高性能MySQL》的1.4节中提及了MySQL中MVCC的实现,原著中提及了
InnoDB implements MVCC by storing with each row two additional, hidden values that record when the row was created and when it was expired (or deleted). Rather than storing the actual times at which these events occurred, the row stores the system version number at the time each event occurred. This is a number that increments each time a transaction begins. Each transaction keeps its own record of the current system version, as of the time it began. Each query has to check each row’s version numbers against the transaction’s version.
我们知道InnoDB中聚簇索引包含了数据行的完整信息,《高性能MySQL》这里说的就是在InnoDB的聚簇索引中的行包含了行记录何时被创建以及何时被删除的信息。《高性能MySQL》这里的描述或许是为了方便读者理解。实际上聚簇索引中的行包含了两个隐藏的字段信息:
DATA_TRX_ID
6字节 最新一个对某记录增删改的事务idDATA_ROLL_PTR
7字节 回滚指针
关于这里信息可以参考storage/innobase/include/data0type.h
头文件。
而对于二级索引记录,是不包含上面这两个隐藏字段信息的,但对于二级索引,会在页中会记录一个PAGE_MAX_TRX_ID
,表示对该页数据修改过的最大事务id。
关于这里的信息可以参考storage/innobase/include/page0page.h
头文件。
2.2 Read View
Read View保存了某一时刻活跃读写事务的快照信息,用来判断某个一致性读是否可见其它事务对表的修改。
其被定义在read0types.h头文件中,下面来看一下其中部分字段:
1 | // 事务id>=m_low_limit_id的修改对于当前读不可见 |
在InnoDB的事务定义(参考trx0trx.h头文件)中包含了一个字段用来表示该事务的Read View。
1 | ReadView* read_view; |
在InnoDB进行进行一致性读时,会判断当前事务的Read View是否存在,如果不存在则get一个新的Read View(InnoDB对于Read View有复用的机制,所以如果不存在可以复用的Read View对象才会去显示地new一个新的出来)。下面是trx_assign_read_view
方法实现:
1 | ReadView* |
下面再来看一下Read View是如何初始化的。
1 | void |
对于Read Committed的隔离级别,在一致性读语句结束后,会关闭掉Read View,而对于Repeatable Read的隔离级别,Read View在创建后会一直到事务结束时才被关闭。
Read View如何判断可见性
上面已经对Read View进行了大致介绍,下面就来看一下InnoDB是如何判断记录是否对当前事务可见的吧。这里的入口是storage/innobase/row/row0sel.cc
的row_search_mvcc
方法。
3.1 走聚簇索引的情况
假设sql查询走的是聚簇索引,则通过下面的lock_clust_rec_cons_read_sees
方法来判断记录rec是否对当前事务可见。
1 | bool |
下面再来看看ReadView::changes_visible方法的实现源码:
1 | bool changes_visible( |
理一下这里判断的依据
- 记录的事务id为
m_creator_trx_id
即当前事务的修改,一定可见。 - 记录的事务id<
m_up_limit_id
,说明Read View在初始化的时候,修改此记录的事务已经提交了,因此可见。 - 记录的事务id>=
m_low_limit_id
,说明Read View在初始化的时候,修改改记录的事务还没开启(准确说是还没被分配到事务id),因此不可见。
如果这里不满足的话,会走到row_sel_build_prev_vers_for_mysql->row_vers_build_for_consistent_read
的调用,根据回滚段中的信息不断构建前一个版本信息直至当前事务可见。
3.2 走二级索引的情况
1 | bool |
下面是ReadView:sees的实现,可以看到其实就是判断是否PAGE_MAX_TRX_ID
小于ReadView初始化时的最小事务id,也就是判断修改页上记录的最大事务id是否在快照生成的时候已经提交了,简单粗暴的很。
1 | bool sees(trx_id_t id) const |
因此这里lock_sec_rec_cons_read_sees
方法如果返回true,那么是一定可见的,返回false的话未必不可见,但下一步就需要利用聚簇索引来获取可见版本的数据了。
在这之前InnoDB会先利用ICP(Index Push Down)根据索引信息来判断搜索条件是否满足,如果不满足那也没必要再去聚簇索引中取了;若ICP判断出符合条件,则会走到row_sel_get_clust_rec_for_mysql
方法中去聚簇索引中取可见版本数据。
4. 总结
本文通过InnoDB源码,介绍了Read View的基本数据结构和概念以及InnoDB中是如何通过创建的Read View来判断可见性。实际上Read View就是一个活跃事务的快照,并且RC和RR隔离级别都复用了同样结构的Read View来判断可见性,不同的是Read View的生命周期根据相应的隔离级别而有所不同。对于不可见的修改,InnoDB通过undo信息重建之前版本的数据直至数据可见。